智能论文笔记

A Spanish dataset for Targeted Sentiment Analysis of political headlines

Tomás Alves Salgueiro , Emilio Recart Zapata , Damián Furman , Juan Manuel Pérez , Pablo Nicolás Fernández Larrosa

分类：自然语言处理

2022-08-30

几项作品已经研究了主观文本，因为它们可以在用户中引起某些行为。大多数工作都集中在社交网络中的用户生成的文本上，但是其他一些文本也包括对某些主题的观点，可能会影响政治决策期间的判断标准。在这项工作中，我们解决了针对新闻头条领域的有针对性情绪分析的任务，该领域由主要渠道在2019年阿根廷总统大选期间发布。为此，我们介绍了1,976个头条新闻的极性数据集，该数据集在2019年选举中以目标级别提及候选人。基于预训练的语言模型的最先进的分类算法的初步实验表明，目标信息有助于此任务。我们公开提供数据和预培训模型。

translated by 谷歌翻译

Machine-Learning the Classification of Spacetimes

Yang-Hui He , Juan Manuel Pérez Ipiña

分类：机器学习

2022-01-05

论一般相对论中的长期分类问题，我们采用机器学习和现代数据科学的富有成效技术采取小说视角。特别是，我们模拟Petrov的分类时间的分类，并表明前馈神经网络可以实现高度的成功。我们还展示了数据可视化技术如何具有维度降低的技术可以帮助分析不同类型的刻度的结构中的底层图案。

translated by 谷歌翻译

RoBERTuito: a pre-trained language model for social media text in Spanish

Juan Manuel Pérez , Damián A. Furman , Laura Alonso Alemany , Franco Luque

分类：自然语言处理

2021-11-18

由于BERT出现，变压器语言模型和转移学习已成为自然语言理解任务的最先进。最近，一些作品适用于特定领域的预训练，专制模型，例如科学论文，医疗文件等。在这项工作中，我们呈现RoberTuito，用于西班牙语中的用户生成内容的预先训练的语言模型。我们在西班牙语中培训了罗伯特托5亿推文。关于涉及用户生成文本的4个任务的基准测试显示，罗伯特托多于西班牙语的其他预先接受的语言模型。为了帮助进一步研究，我们将罗伯特多公开可在HuggingFace Model Hub上提供。

translated by 谷歌翻译

Forecasting through deep learning and modal decomposition in multi-phase concentric jets

León Mata , Rodrigo Abadía-Heredia , Manuel Lopez-Martin , José M. Pérez , Soledad Le Clainche

分类：机器学习

2022-12-24

This work presents a set of neural network (NN) models specifically designed for accurate and efficient fluid dynamics forecasting. In this work, we show how neural networks training can be improved by reducing data complexity through a modal decomposition technique called higher order dynamic mode decomposition (HODMD), which identifies the main structures inside flow dynamics and reconstructs the original flow using only these main structures. This reconstruction has the same number of samples and spatial dimension as the original flow, but with a less complex dynamics and preserving its main features. We also show the low computational cost required by the proposed NN models, both in their training and inference phases. The core idea of this work is to test the limits of applicability of deep learning models to data forecasting in complex fluid dynamics problems. Generalization capabilities of the models are demonstrated by using the same neural network architectures to forecast the future dynamics of four different multi-phase flows. Data sets used to train and test these deep learning models come from Direct Numerical Simulations (DNS) of these flows.

translated by 谷歌翻译

Encoder-Decoder Model for Suffix Prediction in Predictive Monitoring

Efrén Rama-Maneiro , Pablo Monteagudo-Lago , Juan C. Vidal , Manuel Lama

分类：机器学习 | 人工智能

2022-11-29

Predictive monitoring is a subfield of process mining that aims to predict how a running case will unfold in the future. One of its main challenges is forecasting the sequence of activities that will occur from a given point in time -- suffix prediction -- . Most approaches to the suffix prediction problem learn to predict the suffix by learning how to predict the next activity only, not learning from the whole suffix during the training phase. This paper proposes a novel architecture based on an encoder-decoder model with an attention mechanism that decouples the representation learning of the prefixes from the inference phase, predicting only the activities of the suffix. During the inference phase, this architecture is extended with a heuristic search algorithm that improves the selection of the activity for each index of the suffix. Our approach has been tested using 12 public event logs against 6 different state-of-the-art proposals, showing that it significantly outperforms these proposals.

translated by 谷歌翻译

Studying Drowsiness Detection Performance while Driving through Scalable Machine Learning Models using Electroencephalography

José Manuel Hidalgo Rogel , Enrique Tomás Martínez Beltrán , Mario Quiles Pérez , Sergio López Bernal , Gregorio Martínez Pérez , Alberto Huertas Celdrán

分类：机器学习

2022-09-08

嗜睡是驾驶员和交通事故主要原因之一的主要关注点。认知神经科学和计算机科学的进步已通过使用脑部计算机界面（BCIS）和机器学习（ML）来检测驾驶员的嗜睡。然而，几个挑战仍然开放，应该面对。首先，文献中缺少使用一组ML算法的多种ML算法对嗜睡检测性能的全面评估。最后，需要研究适合受试者组的可扩展ML模型的检测性能，并将其与文献中提出的单个模型进行比较。为了改善这些局限性，这项工作提出了一个智能框架，该框架采用了BCIS和基于脑电图（EEG）的功能，以检测驾驶场景中的嗜睡。 SEED-VIG数据集用于喂食不同的ML回归器和三类分类器，然后评估，分析和比较单个受试者和组的表现最佳模型。有关单个模型的更多详细信息，随机森林（RF）获得了78％的F1分数，改善了通过文献中使用的模型（例如支持向量机（SVM））获得的58％。关于可扩展模型，RF达到了79％的F1得分，证明了这些方法的有效性。所学的经验教训可以总结如下：i）不仅SVM，而且文献中未充分探索的其他模型与嗜睡检测有关，ii）ii）适用于受试者组的可伸缩方法也有效地检测嗜睡，即使新受试者也是如此评估模型培训中未包括的。

translated by 谷歌翻译

Gradual Drift Detection in Process Models Using Conformance Metrics

Victor Gallego-Fontenla , Juan C. Vidal , Manuel Lama

分类：人工智能

2022-07-22

在执行现实生活过程中，计划或意外的变化是常见的。检测这些更改是优化运行此类过程的组织的性能的必要条件。最先进的大多数算法都集中在突然变化的检测上，抛开其他类型的变化。在本文中，我们将专注于自动检测渐进漂移，这是一种特殊的变化类型，其中两个模型的情况在一段时间内重叠。所提出的算法依赖于一致性检查指标来自动检测变化，还将这些变化的全自动分类为突然或逐渐分类。该方法已通过一个由120个日志组成的合成数据集进行了验证，该数据集具有不同的变化分布，在检测和分类准确性，延迟和变化区域在比较主要的最新算法方面取得更好的结果。

translated by 谷歌翻译

On the Robustness of Quality Measures for GANs

Motasem Alfarra , Juan C. Pérez , Anna Frühstück , Philip H. S. Torr , Peter Wonka , Bernard Ghanem

分类：机器学习

2022-01-31

这项工作评估了生成模型的质量度量的鲁棒性，例如INPECTION评分（IS）和FR \'Echet Inception距离（FID）。类似于深层模型对各种对抗性攻击的脆弱性，我们表明这种指标也可以通过添加剂像素扰动来操纵。我们的实验表明，可以生成分数很高但知觉质量低的图像分布。相反，人们可以优化对小型扰动，当将其添加到现实世界图像中时，会使他们的分数恶化。我们进一步将评估扩展到生成模型本身，包括最先进的网络样式。我们展示了生成模型和FID的脆弱性，反对潜在空间中的累加扰动。最后，我们证明，通过简单地以强大的启动来代替标准发明，可以强大地实现FID。我们通过广泛的实验来验证鲁棒度量的有效性，这表明它对操纵更为强大。

translated by 谷歌翻译

Embedding Graph Convolutional Networks in Recurrent Neural Networks for Predictive Monitoring

Efrén Rama-Maneiro , Juan C. Vidal , Manuel Lama

分类：机器学习

2021-12-17

对业务流程的预测监控是流程挖掘的子领域，旨在预测下一个事件的特征或下一个事件的序列。虽然已经提出了基于深度学习的多种方法，主要是经常发生的神经网络和卷积神经网络，但它们都不是真正利用过程模型中可用的结构信息。本文提出了一种基于图形卷积网络和经常性神经网络的方法，所述内部网络从过程模型中使用信息。真实事件日志的实验评估表明，我们的方法更加一致，更优于当前的最先进的方法。

translated by 谷歌翻译

Evaluation of Machine Learning Techniques for Forecast Uncertainty Quantification

Maximiliano A. Sacco , Juan J. Ruiz , Manuel Pulido , Pierre Tandeo

分类：机器学习 | 人工智能

2021-11-29

生产精确的天气预报和不确定的不确定性的可靠量化是一个开放的科学挑战。到目前为止，集团预测是最成功的方法，以产生相关预测的方法以及估计其不确定性。集合预测的主要局限性是高计算成本，难以捕获和量化不同的不确定性来源，特别是与模型误差相关的源。在这项工作中，进行概念证据模型实验，以检查培训的ANN的性能，以预测系统的校正状态和使用单个确定性预测作为输入的状态不确定性。我们比较不同的培训策略：一个基于使用集合预测的平均值和传播作为目标的直接培训，另一个依赖于使用确定性预测作为目标的决定性预测，其中来自数据隐含地学习不确定性。对于最后一种方法，提出和评估了两个替代损失函数，基于数据观察似然和基于误差的本地估计来评估另一个丢失功能。在不同的交货时间和方案中检查网络的性能，在没有模型错误的情况下。使用Lorenz'96模型的实验表明，ANNS能够模拟集合预测的一些属性，如最不可预测模式的过滤和预测不确定性的状态相关量化。此外，ANNS提供了在模型误差存在下的预测不确定性的可靠估计。

translated by 谷歌翻译